一文看懂谷歌I/O大会及其AI全家桶
本次I/O大会(开发者大会)主题:Making AI helpful for everyone
大模型
Palm2
一个多功能的人工智能模型,擅长处理各种类型的数据,包括 Python 和 JavaScript 代码,甚至可以处理 Prolog、Fortran 和 Verilog 等编程语言。
训练集
在 100 多种语言中“接受了更多的多语言文本训练”,导致理解、生成和翻译细微差别的文本(如成语、诗歌和谜语)的能力“显著提高”。
数据集包括科学论文和带有数学表达式的网页,进一步提高逻辑、常识推理和数学能力。
在“大量”公共源代码数据集上进行了预训练。除了 Python 和 JavaScript,这还包括在 Prolog、Fortran 和 Verilog 中生成专用代码。
模型尺寸
壁虎(Gecko):每秒可以处理20个令牌,小刀可以在手机上运行
水獭(Otter)
野牛(Bison)
独角兽(Unicorn)
垂直模型
Sec-PaLM:针对安全支持 Med-PaLM 2:针对医疗知识
论文地址
https://9to5google.com/2023/05/10/google-palm-2/
Gemini
多模态大模型,在工具和API集成方面非常高效,双子座仍在训练中,但它已经展示了以前的模型从未见过的多模态功能。
产品矩阵
Bard
产品形态
对话机器人
新增功能
接入网络,能够引用网站数据,生成问答
支持将Bard的回答导出到Gmail和Google Docs
可以用图像来给Bard做prompt,根据图像给出回答
引入Google Lens的功能,支持问答中使用图像
很快将支持第三方应用程序集成,对标chatgpt plugin
产品地址
https://bard.google.com/
Duet AI
产品形态
Workspace 办公套件,对标微软Copilot
应用场景
包括Gmail:自动识别邮件主题,并给出不同的撰写方案
谷歌Docs(文档):点击“help me write”,帮忙自动生成完整文本
Sheets(表格):自然语言自动生成表格
Slides(幻灯片):能直接基于幻灯片中的文本生成图片
产品地址
https://workspace.google.com(需要注册workspace,加入后补名单)
搜索引擎
产品形态
由Palm2驱动的全新搜索引擎,对标New Bing
产品亮点:
基于自然语言搜索并直接给出对话式的答案摘要
答案摘要依据相关的搜索链接生成,并给出相关的链接
可根据上下文持续进行搜索问答来探索主题的更多信息
AI搜索界面植入的广告会在专有广告位中展示,不会混进搜索结果
Magic Editor
产品形态
智能修图应用
产品亮点
改变照片的光线
替换人所处的环境背景
修复照片中被遮挡物品的残缺部分
MusicLM
产品形态
文本转化为音乐的工具
产品亮点
输入提示,一键生成多个版本的歌曲
可以指定“电子”或“古典”等乐器,以及想要的“氛围、情绪或情感”
Vertex AI
产品形态
帮助用户搭建生成式应用程序的AI工具平台
产品亮点
依托谷歌云,涵盖模型训练、微调、托管等全方位的AI服务
提供聊天、文本和图像三种模态的基础模型,用户可进行微调
支持私有化部署,用户的数据安全可以得到保证